查看原文
其他

『百度慧眼中规院联合创新实验室又出新成果』基于短期人口流动数据的全国城市群识别研究

马琦伟,阚长城 百度地图慧眼 2019-09-13

作者:马琦伟,阚长城

阚长城 百度地图资深研发工程师,马琦伟 中国城市规划设计研究院学术信息中心博士

【百度慧眼中规院联合创新实验室】是百度地图慧眼与中国城市规划设计研究院共建的联合实验室。双方发挥各自的资源、技术优势,形成一系列具有行业前瞻性、实用性的研究成果,并促进研究成果的转化与应用。双方联合研究的领域包括:城镇化发展动态监控与政策支持、城市空间诊断、评估与模拟、人工智能与城市智慧管理、城市空间决策支持与业务咨询等。

往期成果

成果一:城市中的“炼金术” ——探析混合用地的奥秘

成果二:超级大都市们的“圆桌骑士团” ——北京和上海的副中心建设成效分析

成果三:【百度+中规院大数据研究成果】 用户通勤方式挖掘及其空间特征浅析

成果四:基于百度大数据的全国城市重要性评价和城镇化分区划定

本文为百度慧眼中规院联合创新实验室发布的系列成果之五:

基于短期人口流动数据的全国城市群识别研究


前言

城市群的识别是新型城镇化发展中的一项基础性任务,对于区域政策制定、经济社会调控等都具有重要意义。当前城市规划界和地理学界对于城市群识别存在多种标准,但基本上均综合考虑了经济联系、社会往来、基础设施建设、空间距离等多重因素。本文以百度地图慧眼提供的人口短期流动数据为基础,借助复杂网络理论,从人口流动的角度探讨我国城市群的识别。

全国短期人口流动概况

下图展示了2017年3月份和4月份各一个星期的全国人口短期流动情况(说明:台湾省各城市的数据暂未获取,因此本研究尚不覆盖台湾省)。由图中我们可以大致看到人口迁徙的一些基本地理特征。

(1)迁徙的不均衡性

人口的短期流动在各城镇之间不是均衡分配的,明显存在一些hub节点(图中线条密度较高的地区)。这些节点具有极大的人口吞吐量,也与绝大多数的城镇均有可观规模的人口往来。这暗示了城市群和枢纽城市的存在。图中已可清晰的辨认出包括京津冀城市群、珠三角城市群、长三角城市群等我国的主要城市群及其中心城市。

(2)胡焕庸线两侧的分异性

胡焕庸线以西的人口迁徙规模和密度明显低于以东地区,表明这条中国最重要的地理分界线对短期人口流动的影响同样显著。

图 1 城镇短期人口迁徙概况图(流动人口规模低于500的迁徙路线不予显示)


上图展示的迁徙关系较为复杂,我们不妨以省为基本统计单位,考察各省之间的短期人口来往情况。

图 2 分省统计的短期人口流动情况(迁徙规模小于5000的线路不予显示)


从上面的和弦图中,我们可以进一步看出一些现象来。

(1)各省份的人口吞吐量极不均衡,既有广东、江苏、河北等人口流动大省,也有福建、甘肃、宁夏等迁徙规模较小的省份。迁徙规模的大小既与该省份的人口基数相关,与该省份的空间区位、经济建设水平、区域发展态势等均有关联。

(2)空间上邻近的省份,短期人口的流动强度相对比较大,例如上海与江苏、江苏与安徽、北京与河北等,均是例证。

以上是短期人口迁徙的一些基本特征,而我们的主要任务,便是从中识别出这一复杂的人口迁徙格局中的内核——城市群。

在开始识别工作之前,还须了解城市人口迁徙的一个基本特征——人口出入强度的幂率分布特征。所谓人口出入强度,即每个城市在规定时间内流入和流出人口规模的总量,如下图所示。大体上我们可以看出,有少量城市的人口出入强度极高,而大量城市的出入强度处于中低水平。为了描述这一特征,我们将数据制成图 4的直方图。该图传递出一个重要的信息:城市人口出入强度近似呈现幂率分布,或曰Zipf分布。这与城市的规模-位序定律等有异曲同工之处。

此处我们再次强调:城市人口出入强度近似呈现幂率分布,这一特征将直接影响我们后文采用的城市群识别方式。

图 3 人口出入强度空间分布图


图 4 按城市统计的人口出入强度直方图

城市群的识别方法

从短期人口流动角度出发,我们认为划定城市群主要遵循以下三个原则:

(1)联系强度足够大,使得城市群之中的各城市具有较强的互动性,形成一个整体。

(2)城市群内各城市须在空间上邻近。空间上距离很大的城市(如北京和上海),即便联系强度很大,也不应划入同一城市群。

(3)城市群内各城市可以不一定在空间上直接接壤。空间距离不远的城市,即便中间隔有其它城市,当联系强度足够大时,也应认为属于同一城市群。换句话说,我们允许城市群中有“空洞”存在。

上述三个原则中,原则2和原则3是一对矛盾,为了协调两者,我们引入一种新的算法——基于距离阻尼的k壳分解算法

(1)什么是k壳分解算法以及我们为何使用这一算法


图 5 k壳分解算法示意


k壳分解算法是复杂网络理论中识别核心团块的一种简单有效的方法。我们暂且将全国各城市之间的短期人口流动所构成的复杂网络视为一棵树或一颗洋葱,将城市群视为树的主干或洋葱的芯,那么k壳分解算法实质上执行的是一个“剪树枝”或“剥洋葱皮”的工作。每一次计算中我们剔除迁徙规模低于网络均值的联系,从而构成一个新的简化的网络。重复上述过程,直至城市群的出现。

k壳分解算法的图解如上图。

(2)为什么在分解k壳时使用均值作为分割值

回到图 4所揭示的现象:城市人口出入强度近似呈现幂率分布。这意味着我们在分解k壳的时候,最好能保持这一内在特征,以使得k-壳算法产生的每一层壳与核的人口出入强度之和仍能呈现幂率分布。

使用均值来分割数据,可以满足我们的需求。这种方法被称为头尾分割法(head-tail breaking,参见江斌的相关研究)。为什么均值是适用的?幂率分布是帕累托分布,具有“长尾”特征。在这种分布中,均值以上部分谓之“头部”,其重要性比较强。显然城市群是城镇体系中最为重要的部分,因此我们用k壳分解方法反复提取城镇网络的“头部”,其结果自然符合城镇体系的内禀特征,可以达到我们的目的

(3)什么是距离阻尼以及为何要引入距离阻尼

考虑前文所述的城市群识别的三条原则中的后两条,为了协调这两者之间的矛盾,我们构造一个基于距离的阻尼函数,其定义是:空间距离越远,阻力值越大,对两城市之间的人口流动总量的折损越多。通过这个函数,我们重新计算城市之间的加权迁徙强度。下图展示了引入距离阻尼作用后,香港特别行政区与广东省各城市之间的人口迁徙强度。

图 6 引入距离阻尼作用之后香港与广州各城市的人口迁徙强度

城市群的识别结果

应用基于距离阻尼的k壳分解算法,我们对全国城市群进行了识别。下图展示了城市群是如何在一层层的剥去“洋葱皮”之后浮现出来的。

图 7 城市群识别过程的动态展示


“洋葱皮”剥到了第四层时,我们已经得到了城市群识别的结果。将此结果与《全国城镇体系规划(2006-2020年)》中的规划布局比对可知,规划所确立的我国城镇体系空间结构已基本成型,东部沿海发展带持续强化,京津冀城市群、长三角城市群和珠三角城市群三大城市群趋于成熟;广大中部、西南部崛起态势明显,不仅武汉城市群、成渝城市群等“老牌”城市群势头不减,中原城市群、长株潭城市群、黔中城市群等的发展也已初见成效。

图 8 全国城市群识别结果

图 9 《全国城镇体系规划2006-2020年》中的城市群

一些有趣的发现

审视城市群识别的结果,可以发现一些有意思的现象。

(1)独行侠

有一类城市,他们身处城市群之中,却尚未完全融入,与周边地区的人口交流尚不足够频繁,显得“特立独行”,山西省阳泉市和山东省莱芜市最为典型

图 10 城市群中的“空洞”


(2)“千呼万唤未出来”的城市群

山东半岛城市群和呼包鄂榆城市群在近年来的各级各类城镇体系规划中曝光率都很高,但从本文分析的结果来看,两者都尚未真正成型

图 11 未成型的呼包鄂城市群和山东半岛城市群


(3)城市群中的“新贵”

我们还注意到,还有一些城市群在06版全国城镇体系规划中并未重点提出,但经过多年发展,已初步成型,成为新型城镇化中的“生力军”,典型代表是兰西城市群和黔中城市群

图 12 异军突起的兰西城市群和黔中城市群

谁是城市群人口一体化比拼的最终赢家?

我们注意到,在使用k壳分解算法识别城市群之后,事实上我们还可以接着执行该算法,最终通过层层筛选,必然可以得到全国短期人口迁徙强度最高的城市群。过程如下图。

图 13 识别短期人口迁徙强度最大的城市群


(1)第5层k壳分解

可以看到,包括黔中城市群、滇中城市群、哈长-辽中城市群等在内的诸多城市群已经率先退出竞赛。

(2)第6层k壳分解

我国城市群中的三大王者——京津冀城市群、珠三角城市群和长三角城市群赫然在列。

另外关中城市群中的西安与咸阳也在列,但考虑到随着同城化建设,这两个城市实际上已经逐步合二为一,两者间的联系强度已经不属于城市间的联系,而成为城市内部联系。因此这两个城市在此不参与竞争。

(3)第7层k壳分解

最终的优胜者产生了,它是——珠三角城市群,其广州、佛山、东莞、深圳四个城市联系紧密度为全国之最,证明了珠三角城市群在城市群一体化方面的全国领先地位。

结语

本研究使用百度人口迁徙数据,借助复杂网络理论,建立基于距离阻尼的k壳分解算法,以此对全国城市群的发展现状进行评述。


数据洽谈合作请联系huiyan@baidu.com

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存